首页> 外文OA文献 >A Minimal Variance Estimator for the Cardinality of Big Data Set Intersection
【2h】

A Minimal Variance Estimator for the Cardinality of Big Data Set Intersection

机译:大数据集基数的最小方差估计   路口

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In recent years there has been a growing interest in developing "streamingalgorithms" for efficient processing and querying of continuous data streams.These algorithms seek to provide accurate results while minimizing the requiredstorage and the processing time, at the price of a small inaccuracy in theiroutput. A fundamental query of interest is the intersection size of two bigdata streams. This problem arises in many different application areas, such asnetwork monitoring, database systems, data integration and informationretrieval. In this paper we develop a new algorithm for this problem, based onthe Maximum Likelihood (ML) method. We show that this algorithm outperforms allknown schemes and that it asymptotically achieves the optimal variance.
机译:近年来,对于开发用于有效处理和查询连续数据流的“流算法”的兴趣日益浓厚。这些算法试图在提供准确结果的同时,将所需的存储和处理时间降至最低,但代价是输出的准确性不高。感兴趣的基本查询是两个大数据流的交集大小。这个问题出现在许多不同的应用领域,例如网络监视,数据库系统,数据集成和信息检索。在本文中,我们基于最大似然(ML)方法开发了一种针对此问题的新算法。我们证明了该算法优于所有已知方案,并且渐近实现了最佳方差。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号